Introduction à R

Open Data France et datactivi.st

Introduction à R, le couteau suisse de la data science

Jour 6

Joël Gombin et Samuel Goëta (datactivi.st)

Retrouvez les matériaux sur : www.github.com/datactivist/IntroR_ODF

Pad collaboratif : https://frama.link/formationR_pad4

Ce qu’on a déjà appris

Ce qu’on a déjà appris

Consolidation des acquis

Exercice : importer un jeu de données, le nettoyer/préparer, représenter graphiquement la relation entre trois variables, la tester dans le cadre d’un modèle

Un exemple

R, un potentiel cartographique énorme

http://joelgombin.github.io/makingof.html

Des avantages

Quelques pistes/ressources

Notions de cartographie

Qu’est-ce qu’une carte ?

“Une carte est une représentation géométrique plane simplifiée et conventionnelle de tout ou partie de la surface terrestre, et cela dans un rapport de similitude convenable qu’on appelle échelle.” (F. Joly, 1976)

Référence : Béguin et Pumain, 2014 (3e éd.)

La notion de projection

La projection est l’outil mathématique qui permet de passer du géoïde représentant la Terre à une représentation plane.

Projections conformes (Mercator, Lambert) ou équivalentes (Eckert IV, Gall). Il y a toujours une déformation !

Les coordonnées géographiques sont exprimées en longitude et latitude. Les unités peuvent être des degrés ou des grades. La projection transforme les coordonnées géographiques en coordonnées x/y.

La notion de projection

Exemple de coordonnées géographiques :

largeur

La notion de projection

Un truc cool pour jouer avec les différentes projections :

http://bl.ocks.org/mbostock/raw/3711652/

La notion de projection

The West Wing, la série qui arrive à faire un sketch drôle sur les projections géographiques :

L’échelle

L’échelle d’une carte représente le rapport d’une distance mesurée sur la carte à sa valeur réelle sur le terrain.

Échelle 1 cm représente
1/10000 100 m
1/25000 250m
1/50000 500m
1/100000 1km
1/1000000 10km

L’échelle

Attention : “petite échelle” = grande superficie représentée “grande échelle” = petite superficie représentée

L’échelle est déformée à distance du centre de projection (équateur pour Mercator)

Échelle numérique et échelle graphique

largeur

La généralisation

“L’opération qui par sélection, schématisation et harmonisation reconstitue sur une carte la réalité de la surface représentée dans ses traits essentiels en fonction du but de la carte, de son thème, de son échelle et des particularités de la région cartographiée.”

La sélection

Quelles couches d’information représenter ? Ni trop (surcharge d’information, à la Google Maps) ni trop peu (rendre la carte intelligible au lecteur).

Le style “toner” peut être utile pour trouver cet équilibre, en cartographie thématique :

largeur

La schématisation

Opération de simplification, qui peut être structurale (tracés) ou conceptuelle (schéma).

Attention : on peut simplifier à partir de données détaillées, mais on ne peut pas faire l’inverse ! Donc toujours veiller à conserver les données dans leur forme la plus détaillée.

Le fond de carte

Le fond de carte est constitué des éléments repris d’une carte topographique (par exemple de l’IGN) et utilisés pour une carte thématique.

“Carte reproduite totalement ou partiellement, en une ou plusieurs couleurs souvent atténuées, servant de repère pour le report en surcharge de phénomènes localisables déterminés” (CFC). Peut concerner les découpages administratifs, le réseau routier, hydrographique, les courbes de niveau, etc.

Les sources de fonds de carte

Traditionnellement, en France : l’IGN.

De plus en plus : Google Maps, Open Street Map, Stamen…

http://maps.stamen.com/toner/#12/48.8974/2.2017

http://maps.stamen.com/watercolor/#12/48.8974/2.2017

Vecteur ou raster

Comment stocker et représenter l’information géographique ?


Voir la source

Cartes choroplèthes

Une carte choroplèthe est une carte thématique où les régions sont colorées ou remplies d’un motif qui montre une mesure statistique, tels la densité de population ou le revenu par habitant. Ce type de carte facilite la comparaison d’une mesure statistique d’une région à l’autre ou montre la variabilité de celle-ci pour une région donnée.

Cartes en anamorphose ou cartogramme

“La cartographie en anamorphose a pour but d’adapter la forme de la carte non pas à la réalité physique mais plutôt à la réalité perçue.” (Langlois et Denain, 1996)

On déforme le fond de carte en fonction d’une variable quantitative (voire arbitrairement).

largeur

Le langage cartographique

Bertin, 1965 : travail sur la sémiologie graphique. La carte, comme le graphique, permettent de percevoir en même temps trois informations (X,Y,Z).

Mais pour que cette communication soit efficace, il faut respecter un langage précis et ses règles.

Assez comparable à la grammaire des graphiques.

Les composantes du langage cartographique

Les variables visuelles

La forme

La taille

Un exemple d’utilisation incorrecte (non-proportionnelle) de la taille :

La taille

largeur

La taille

La couleur

La couleur

La couleur

La couleur

La couleur

La couleur